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LBSN 中 融合 时 空 信息 的 连续 兴趣 点 推荐 
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d X. 针对 位 置 社 交 网 络 (location-based social networks, LBSN) 中 连续 兴趣 点 推荐 系统 面临 的 数据 稀 朴 性 、 签 到 
数据 的 隐 式 反馈 属性 、 用 户 的 个 性 化 偏好 等 挑战 ， 提 出 一 种 融合 时 空 信息 的 连续 兴趣 点 推荐 算法 。 该 算法 将 用 户 的 签 
到 行为 建 模 为 用 户 一 当前 兴趣 点 一 下 一 个 兴趣 点 一 时 间 段 的 四 阶 张 量 ， 并 利用 LBSN 中 的 地 理 信息 定义 用 户 访问 兴趣 
点 的 地 理 距 离 偏好 ， 最 后 采用 BPR (Bayesian personalized ranking) 标准 优化 目标 函数 。 实 验 结果 表明 该 算法 相 比 其 他 
先进 的 连续 兴趣 点 推荐 算法 具有 更 好 的 推荐 效果 。 
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Successive point-of-interest recommendation with spatial-temporal influence in LBSN 
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Science & Technology, Beijing Institute of Technology, Beijing 100081, China) 


Abstract: This paper studies the successive POI recommendation problem in location-based social networks and the challenge 
lies in the data sparsity, implicit user feedback and personalized preference. To this end, the paper propose a novel model for 
successive POI recommendation, which integrates temporal information and geographical influence. Specifically, the paper 
model the successive check-in behaviors as a fourth-order tensor and employ geographical influence to define the spatial 
preference of the user for the POI. Bayesian personalized ranking criterion is then utilized to optimize the loss objective 
function. Experimental results demonstrate that the proposed model outperforms the state-of-the-art successive POI 
recommendation methods. 
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在 的 兴趣 点 与 接 下 来 要 访问 的 兴趣 点 之 间 具 有 很 强 的 相关 性 。 

例如 当 用 户 晚 上 下 班 离开 办 公 室 之 后 ， 通 常会 去 吃饭 ， 而 不 是 
近年 来 ， 随 着 带 有 GPS 定位 功能 的 智能 手机 越 来 越 普及 ， 去 户外 远 行 。 这 种 签到 行为 的 序列 模式 3 在 兴趣 点 推荐 任务 中 
用 户 可 以 轻易 地 获取 实时 地 理 位 置信 息 ， 并 对 访问 的 兴趣 点 进 ”是 非常 重要 的 因素 ， 在 构建 兴趣 点 推荐 模型 的 过 程 中 要 基于 用 
行 签到 (check-in) 或 与 好 友 分 享 自己 的 体验 , 这 就 促进 了 位 置 户 当前 所 在 的 兴趣 点 ， 此 时 ， 兴 趣 点 推荐 的 任务 是 基于 用 户 当 


0 引言 


社交 网 络 的 快速 发 展 ， 如 Foursquare、Gowalla、 街 旁 等 。LBSN 前 所 在 的 兴趣 点 为 用 户 推荐 接 下 来 要 访问 的 兴趣 点 ， 即 连续 兴 

把 线 上 虚拟 社会 与 线 下 真实 世界 进行 有 机 结合 ， 使 得 用 户 可 以 ” 趣 点 推荐 。 连 续 兴趣 点 推荐 不 仅 可 以 增强 用 户 体验 和 提高 用 户 

随时 随地 获取 和 分 享 位 置信 息 ; 与 此 同时 ， 兴 趣 点 的 数量 也 随 ” 对 网 络 平台 的 依赖 性 ， 而 且 可 以 帮助 广告 商 将 广告 有 针对 性 地 

着 城市 的 发 展 而 迅速 增长 ， 导 致 用 户 面临 信息 过 载 问题 。 兴 推送 给 目标 客户 群 。 

点 推荐 旨 在 为 用 户 推荐 可 能 感 兴趣 的 地 理 位 置 ， 已 经 成 为 满足 推荐 系统 早已 被 学 术 界 深入 研究 ， 并 在 工业 界 得 到 广泛 应 

用 户 个 性 化 需求 和 解决 信息 过 滤 问 题 的 重要 手段 ， 得 到 了 学 术 。 用 。 然 而 ， 由 于 LBSN 是 一 种 包含 用 户 与 用 户 之 间 关 系 、 用 户 

界 和 工业 界 的 广泛 关注 。 与 兴趣 点 之 间 关 系 、 兴 趣 点 与 兴趣 点 之 间 关 系 的 复杂 异 构 网 络 
当前 的 兴趣 点 推荐 研究 中 将 用 户 的 全 部 签到 数据 看 做 一 个 4， 相 比 于 传统 推荐 系统 ， 连 续 兴 趣 点 推荐 系统 面临 一 些 新 的 

整体 ， 这 种 方式 仅 考 虑 了 用 户 与 兴趣 点 之 间 的 签到 关系 ， 而 忽 。 ”挑战 。 

视 了 用 户 连 续 访问 的 兴趣 点 之 间 的 关系 。 实 际 上 ， 用 户 当前 所 a) 数据 稀 疏 性 。 用户 的 签到 行为 具有 自主 性 ， 由 于 涉及 到 
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个 性 隐私 问题 ， 用 户 会 有 选择 地 在 一 部 分 兴趣 点 上 进行 签到 ， 点 的 喜爱 程度 ， 根 据 用 户 的 兴趣 偏好 进行 推荐 。 随 着 LBSN 中 
这 种 签到 方式 导致 用 户 位 置 轨迹 数据 存在 严重 的 稀疏 性 问题 。 情景 因素 的 日 益 增多 , 包括 时 间 信息 、 地 理 信息 、 分 类 信息 等 ， 


另外 ， 位 置 社 交 网 络 中 兴趣 点 的 数量 十 分 巨大 ， 而 用 户 只 能 访 。 当前 的 研究 工作 试图 融合 LBSN 中 影响 用 户 签到 行为 的 情景 信 

问 有 限 数量 的 兴趣 点 ， 这 同样 导致 签到 数据 极度 稀 玻 。 息 进一步 提升 推荐 推荐 的 性 能 .根据 融合 情景 信息 的 不 同类 型 ， 
b) 签到 数据 的 隐 式 反馈 属性 。 不 同 于 传统 推荐 系统 中 用 户 可 以 将 连续 兴趣 点 推荐 系统 分 为 三 类 。 

通过 评分 表达 显 式 反 馈 ， 用 户 在 兴趣 点 上 的 签到 行为 是 一 种 隐 a) 融合 时 间 信 息 的 连续 兴趣 点 推荐 系统 。 用 户 与 LBSN 

式 反馈 ， 其 中 正 反馈 是 已 经 签到 过 的 兴趣 点 ， 未 签到 的 兴趣 点 ”的 每 次 交互 都 有 时 间 惟 ， 而 且 用 户 的 签到 行为 随 着 时 间 的 变化 


包括 用 户 确实 不 感 兴趣 的 兴趣 点 和 用 户 尚未 发 现 但 感 兴趣 的 兴 ”呈现 出 周期 性 特征 中 ， 因 此， 时 


司 信息 是 LBSN 中 重要 的 情景 


趣 点 。 这 种 只 有 正 反馈 而 缺少 负 反 馈 的 签到 数据 ， 给 连续 兴趣 ”信息 , 对 用 户 的 签到 行为 影响 很 大 。 Li 等 人 "9 分析 了 用 户 行为 

点 推荐 带 来 了 挑战 。 模式 随 着 时 间 的 变化 趋势 ， 考 虑 用 户 的 长 期 偏好 和 短期 偏好 ， 
c) 用 户 的 个 性 化 偏好 。LBSN 中 用 户 的 个 性 化 主要 表现 在 。 ”提出 一 种 基于 时 间 感 知 的 连续 兴趣 点 推荐 算法 。 

两 个 方面 : 其 一 ， 用 户 的 兴趣 偏好 是 随 着 时 间 和 地 理 位 置 的 变 b) 融合 地 理 信息 的 连续 兴趣 点 推荐 系统 。 由 于 签到 行为 是 

化 而 动态 变化 的 ， 例 如 ， 大 部 分 用 户 中 午 下 班会 去 餐厅 吃饭 ， 用 户 与 兴趣 点 之 间 的 物理 交互 ， 从 访问 成 本 的 角度 而 言 ， 用 户 


而 晚上 下 班会 直接 回 家 ; 其 二 ， 两 个 有 相似 兴趣 偏好 的 用 户 也 ”更 加 倾向 于 访问 距离 较 近 的 兴趣 点 ”。 这 种 地 理 邻 近 性 显著 影 
可 能 会 有 不 同 的 行为 模式 ， 例 如 同样 是 去 购买 服装 ， 学 生 们 更 。” 响 着 用 户 的 签到 行为 中， 大 量 研究 工作 将 地 理 信息 融入 连续 兴 
多 去 休闲 运动 装 类 服装 店 , 而 上 班 族 偏爱 去 职业 装 正 装 类 商店 。 ” 趣 点 推荐 。 Cheng 等 人 "3 提出 一 种 基于 张 量 分 解 的 连续 兴趣 点 
因此 ， 连 续 兴 趣 点 推荐 系统 应 该 根据 用 户 的 个 性 化 偏好 ， 为 用 E 荐 模型 ， 该 模型 将 与 用 户 地 理 距离 较 近 的 兴趣 点 作为 推荐 对 
站 推荐 符合 个 人 偏好 的 兴趣 点 。 象 ， 这 种 使 用 较 小 候选 兴趣 点 集合 的 方式 可 以 降低 计算 成 本 ， 
针对 以 上 所 述 的 挑战 ， 本 文 提 出 一 种 融合 时 空 信息 的 连续 ”提高 推荐 效率 。 
兴趣 点 推荐 模型 。 该 模型 有 效 融合 LBSN 中 影响 用 户 签到 行为 c) 融合 分 类 信息 的 连续 兴趣 点 推荐 系统 。LBSN 中 的 兴趣 
的 时 间 信 息 和 地 理 信息 来 处 理 数据 稀 艳 性 问题 ， 提 高 了 推荐 系 ”点 通常 被 划分 到 不 同 的 分 类 ， 用 户 访 问 过 的 兴趣 点 的 分 类 信息 
统 的 准确 率 。 具 体 而 言 ， 首 先 ， 将 用 户 的 历史 签到 数据 建 模 为 ” 隐 含 了 用 户 的 行为 模式 ， 例 如 购物 达 人 喜欢 去 各 种 商城 ， 美 信 
用 户 一 当前 兴趣 点 一 下 一 个 兴趣 点 一 时 间 段 的 四 阶 张 量 ， 基 于 ”家 热衷 于 在 餐厅 签到 等 ， 这 些 分 类 信息 有 助 于 理解 用 户 的 兴趣 
该 四 阶 张 量 ， 利 用 张 量 分 解 模型 推断 用 户 对 每 个 兴趣 点 的 个 性 ”偏好 。He 等 人 中 提出 一 种 两 阶段 的 连续 兴趣 点 推荐 框架 ， 首 
化 偏好 ， 然 后 ， 根 据 用 户 活动 范围 的 地 理 距 离 限制 ， 定 义 用 户 ”” 先 预测 用 户 接 下 来 要 访问 的 兴趣 点 分 类 ， 然 后 根据 分 类 预测 结 
访问 兴趣 点 的 地 理 距离 偏好 ， 作 为 衡量 用 户 对 兴趣 点 偏好 程度 。 果 向 用 户 推 荐 接 下 来 要 访问 的 兴趣 点 。 
的 因素 ; 最 后 ， 针 对 签到 数据 的 隐 式 反馈 属性 ， 将 用 户 已 签到 ] 户 在 兴趣 点 签到 的 同时 ， 也 会 发 表 简 短评 论 ， 这 些 内 容 
兴趣 点 和 未 签到 兴趣 点 组 成 的 兴趣 点 对 作为 训练 样本 ,采用 ”信息 描述 了 用 户 对 兴趣 点 的 喜 xum. 大 量 研究 工作 0 积极 
BPR “标准 优化 目标 函数 。 探索 并 利用 内 容 信息 来 提高 推荐 质量 。 同 时 ， 用 户 对 兴趣 点 的 
本 文 的 贡献 总 结 如 下 : 评论 内 容 较 短 ， 由 于 短文 本 具有 较 稀 朴 、 噪 声 大 、 歧 义 多 的 特 
a) 本 文 根 据 用 户 连 续 访 问 的 兴趣 点 之 间 的 相关 性 , 基于 当 点 ， 给 推荐 任务 带 来 了 极 大 挑战 。 此 外 ， 社 交 关 系 是 LBSN 从 


前 所 在 的 兴趣 点 向 用 户 推荐 接 下 来 要 访问 的 兴趣 点 ， 为 用 户 提 传统 社交 网 络 继承 的 性 质 和 属性 ， 研 究 人 员 试 图 利用 社交 关系 
供 准确 高 效 的 连续 兴趣 点 推荐 服务 。 提高 推荐 系统 准确 率 ; 然而 也 有 一 些 研究 工作 2 表明 ， 只 有 
b) 本 文 提出 一 个 融合 时 空 信息 的 连续 兴趣 点 推荐 模型 , 通 ”小 部 分 用 户 在 访问 兴趣 点 方面 与 好 友 具 有 相似 的 偏好 ， 社 交 关 
过 融合 位 置 社交 网 络 中 的 时 间 信 息 和 空间 信息 ， 有 效 缓解 了 数 。” 系 对 用 户 签到 行为 的 影响 有 限 。 
de Miu [RSS 根据 签到 数据 的 隐 式 反馈 属性 ， 采用 BPR 算法 综 上 所 述 ， 当 前 研究 工作 直接 将 与 用 户 相距 较 远 的 兴趣 点 
拟 合 兴 趣 点 对 上 的 偏 序 关系 ， 从 而 获得 用 户 对 兴趣 点 的 个 性 化 ”过 滤 掉 3， 以 此 处 理 数 据 稀疏 问题 。 这 种 方式 无 法 为 用 户 推荐 
偏好 。 相距 较 远 的 兴趣 点 ， 难 以 满足 乐于 远 行 用 户 的 兴趣 偏好 。 在 融 
c) 本 文 在 两 个 真实 LBSN 的 大 规模 签到 数据 集 上 进行 大 量 合 时 间 信 息 方面 , 当前 研究 工作 "9 仅 利 用 了 用 户 签到 行为 按照 
的 实验 评估 所 提 模 型 的 性 能 ， 实 验 结果 表明 本 文 提出 的 模型 优 ”小 时 的 周期 性 特征 ,未 考虑 用 户 签到 行为 随 着 星期 的 变化 规律 ， 
于 其 他 先进 的 连续 兴趣 点 推荐 算法 。 其 他 研究 工作 Y 则 将 每 天 按照 小 时 分 为 24 个 时 间 段 , 用 户 的 
1 ”相关 工作 签到 数据 也 相应 地 划分 到 这 24 个 时 间 段 中 , 使 得 原本 就 稀疏 的 
签到 数据 变 得 更 加 稀 朴 。 本 文 提 出 一 种 融合 时 空 信息 的 连续 兴 
连续 兴趣 点 推荐 是 推荐 系统 领域 中 的 一 个 重要 任务 ,已 经 趣 点 推荐 模型 ， 即 一 方面 将 一 天 的 时 间 分 为 工作 时 间 和 生活 时 
成 为 LBSN 中 一 项 的 位 置 服务 。 连 续 兴趣 点 推荐 系统 使 用 。 间 ， 将 星期 分 为 工作 日 和 休息 日 ， 这 样 时 间 和 星期 共同 引 
历史 签到 数据 对 用 户 的 行为 规律 进行 建 模 ， 并 挖掘 用 户 对 兴 个 时 间 段 ， 并 与 用 户 、 当 前 兴趣 点 和 下 一 个 兴趣 点 共同 组 成 四 
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阶 张 量 ， 使 用 张 量 分 解 算法 填补 张 量 中 的 缺失 值 ， 有 效 解决 了 〈 周 一 至 周 五 ) 和 休息 日 〈 周 六 和 周 日 ) 两 个 部 分 ， 这 样 小 时 
数据 稀疏 性 问题 ， 另 一 方面 根据 用 户 对 兴趣 点 的 偏爱 程度 随 着 ”和 星期 共同 组 成 四 个 时 间 段 , 即 工作 日 白天 五 ,工作 日 晚上 三 ， 
地 理 距离 的 增 大 而 减 小 ,定义 用 户 访 问 兴趣 点 的 地 理 距离 偏好 ， ”休息 日 白天 石和 休息 日 晚上 ， 时 间 信 息 可 以 表示 为 
使 得 与 用 户 相 距 较 远 的 兴趣 点 也 有 可 能 成 为 候选 推荐 对 象 ， 从 工 = 人 ,237 。 用 户 在 每 个 时 间 段 内 的 连续 签到 行为 都 可 以 
而 提高 兴趣 点 推荐 的 准确 率 。 建 模 成 类 似 于 张 量 X 的 三 阶 张 量 ， 全 部 时 间 段 上 的 连续 签到 行 
为 被 建 模 成 用 户 、 当 前 兴趣 点 、 下 一 个 兴趣 点 和 时 间 段 的 四 阶 
2 ”融合 时 空 信息 的 连续 兴趣 点 推荐 KEZ, Ze om, qid Zu 表示 用 
2.1 问题 描述 P u FERTA t 从 当前 兴趣 点 i 转移 到 下 一 个 兴趣 点 7。 如 图 1 
$ U={u,u Uy} 是 LBSN 中 的 一 组 用 户 ，M 代表 用 户 。” 所 示 ， 图 中 上 方 的 三 阶 张 量 中 包含 了 用 户 在 不 同时 间 段 内 的 签 
的 数量 。L={l,b,…sly} 是 LBSN 中 的 一 组 兴趣 点 ， 其 中 每 个 。” 到 数据 历史 签 到 数据 包含 在 全 部 三 阶 张 量 组 成 的 四 阶 张 量 Z 
兴趣 点 具有 唯一 标志 ， 且 由 {经 度 ， 纬 度 } 进 行 地 理 编码 ，N 代 ”中 。 估 算 用 户 访问 兴趣 点 的 个 性 化 偏好 就 等 价 于 求 张 量 Z 的 一 
表 兴 趣 点 的 数量 。 用 户 签到 行为 由 四 个 元 组 (wi jj) 组成, 表示 。 ”个 近似 。 


FAP u 在 时 间 f 从 当前 兴趣 点 i 移动 到 下 一 个 兴趣 点 j。 用 户 4 grins NODI, 
TERRE] t Z mí 8000 — HELGB H L, 表示 。 本 文 所 要 解决 的 问 geeen... qiii 
题 是 根据 用 户 的 历史 签到 数据 LL, ， 为 用 户 4 推荐 在 时 间 1 要 访 Xarra En 
问 的 兴趣 点 。 Mic irr r. 
下 一 个 兴趣 点 下 一 个 兴趣 点 

22 模型 Ti Ti 

本 文 提出 的 模型 首先 计算 用 户 在 时 间 t 从 当前 兴趣 点 i 图 1 四 阶 张 量 的 图 示 化 说 明 
移动 到 下 一 个 兴趣 点 j 的 转移 概率 ， 然 后 根据 转移 概率 对 兴 由 于 张 量 Z 中 只 有 一 部 分 的 非 零 元 素 ， 所 以 需要 利用 类 似 
点 进行 排序 ， 将 排 在 前 N 位 的 兴趣 点 推荐 给 用 户 。 假 设 用 户 的 。 ”于 算 阵 分解 中 的 低 秩 近似 技术 ， 将 那些 未 观察 到 的 转移 项 进行 


签到 行为 满足 一 阶 马 尔 可 夫 性 质 ， 那 么 转移 概率 可 以 表示 为 填充 。 对 于 四 阶 张 量 Z 的 近似 可 以 采用 Tucker 分 解 算法 1 5 B 
Xijs 7 PQQ,;, IQ.) (1) 者 正则 分 解 (canonical decomposition) 算法， 其 中 正则 分 解 
其 中 : Qu; 表示 用 户 u duds 的 兴趣 点 是 i; Qu KIRMA U 算法 可 以 看 做 是 Tucker 分 解 算法 的 一 个 特例 。 正则 分 解 算法 只 
在 时 间 上 访问 的 下 一 个 兴趣 点 是 / 。 为 了 准确 建 模 用 户 的 行为 考虑 张 量 中 四 个 维度 ( 即 用 户 UV 、 当 前 兴趣 点 了、 下 一 个 兴趣 
模式 ， Fp E 荐 模型 同时 考虑 了 用 户 访 问 兴 点 了 了、 时 间 段 7 ) 中 两 两 之 间 的 交互 ， 即 用 户 访 问 兴趣 点 的 个 


趣 点 的 个 性 化 偏好 和 地 理 距离 偏好 。 性 化 偏好 可 以 被 估算 为 
2.2.1 个 性 化 偏好 2, oU 1 ey] eI y uy? a 

LBSN 中 的 历史 签到 数据 是 用 户 从 当前 兴趣 点 ;转移 到 pep 人 二 PT 十 Te Q) 
下 一 个 兴趣 点 7 的 转移 记录 ， 可 以 把 用 户 、 当 前 兴趣 点 和 下 一 。 ”其 中 : va ov/ 表示 用 户 与 下 一 个 兴趣 点 之 间 的 相互 关系 ; v0” 


个 兴趣 点 组 成 三 阶 张 量 Xx， 即 repo] mH, EPER 。 表示 用 户 在 此 相互 关系 中 的 隐 式 特征 向 量 , 式 (2) 中 其 他 的 因 
素 luii 表示 观察 到 的 转移 记录 。 子 项 是 类 似 的 含义 。 由 于 因子 项 Pw v w, Vp” 
于 用 户 的 签到 行为 受到 时 间 的 影响 和 限制 , 例如 用 户 。” 与 下 一 个 兴趣 点 J 无 关 且 不 影响 转移 概率 的 排名 ， 所 以 可 将 该 


在 中 午 通常 会 去 餐厅 吃饭 而 不 会 去 酒吧 或 KTV, 周末 常 去 户外 ”项 移 除 "71。 个 性 化 偏好 的 估计 值 可 以 表示 为 

远 行 而 很 少 去 办 公 室 ， 通 过 对 时 间 信息 的 分 析 ， 可 以 发 现 用 户 CA 7 Y m] evi ev 6) 
的 行为 模式 随 着 时 间 变化 的 周期 性 规律 ， 从 而 更 加 准确 地 建 模 2.2.2 地 理 距 离 偏好 

用 户 访问 兴趣 点 的 个 性 化 偏好 。 通 常用 户 在 相 邻 的 时 间 内 具有 文献 [10] 的 研究 发 现 ， 用 户 的 签到 记录 大 部 分 集中 在 地 
相似 的 兴趣 偏好 ， 例 如 用 户 一 般 在 上 午 9 点 开始 工作 ， 午 饭 大 ” 理 距 离 很 小 的 范围 中 ， 这 表明 地 理 信息 对 用 户 的 签到 行为 有 着 


多 集中 在 中 午 12 点 前 后 ,当前 研究 工作 把 每 天 按照 小 时 划分 为 ” 重要 影响 。 在 现实 中 ， 用 户 的 活动 范围 通常 会 集中 在 一 些小 范 
24 个 时 间 段 ， 用户 的 签到 数据 也 被 划分 到 相应 的 时 间 段 中 , 人 大 中， 例如 居住 地 附近 或 者 工作 单位 附近 ， 使 得 签到 兴趣 点 形 
是 这 会 导致 原本 就 稀疏 的 签到 数据 变 得 更 加 稀疏 ;其 他 研究 工 。 成 地 理 集群 区 域 。 当 前 研究 工作 通过 设 定 用 户 访 问 区 域 的 距离 
作 仅 考虑 了 用 户 的 行为 模式 随 着 小 时 的 变化 规律 ， 而 未 考虑 签 “ 效 值 ， 仅 将 阔 值 范围 之 内 的 兴趣 点 推荐 给 用 户 ， 而 本 文 定义 用 
到 行为 按照 星期 呈现 出 的 周期 性 特征 。 P u 访问 相距 di km 的 兴趣 点 的 地 理 距离 偏好 是 od, ， 参 数 
文献 [14] 将 用 户 状态 按照 一 天 的 时 间 分 为 工作 状态 和 生 P 的 最 优 值 将 在 模型 优化 阶段 学 习 得 来 ， 这 样 与 用 户 相 距 较 远 
活 状态 ， 根 据 用 户 的 这 两 种 状态 可 以 简单 有 效 地 刻画 签到 行为 的 兴趣 点 也 有 可 能 成 为 候选 对 象 。 
的 周期 性 特征 ， 因 此 ， 本 文 将 一 天 的 时 间 划 分 为 白天 8 点 至 将 个 性 化 偏好 和 地 理 距 离 偏 好 线性 加 和 ， 得 到 计算 转移 概 
17 点 ) 和 晚上 (18 点 至 7 点 ) 两 个 部 分 ,将 星期 划分 为 工作 日 率 的 估计 值 为 
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录用 定稿 $44, 4 连续 兴趣 点 推荐 
X us Md yp wi +y” 77 + pedi; (4) £$(00-$, 
的 连续 兴趣 点 推荐 模型 可 以 满足 热爱 长 距离 远 行 用 户 的 个 性 化 ”于 模型 的 对 数 似 然 函数 ， 使 用 极 大 后 验 概率 得 到 参数 6 为 
需求 。 arg max In lI pan »,;, n|6)p(0) 
23 ”模型 优化 和 参数 求解 o (uim e Dar 
传统 模型 优化 算法 PU 将 缺失 项 看 做 样本 负 例 ， 直 接 拟 合 n E 
-agmax J, nol, imi uin) zle aD 
四 阶 张 量 中 的 非 缺 失 项 ， 由 于 LBSN rts SUUS Je E A O bm Dg 
的 ， 在 四 阶 张 量 中 非 零 元 素 所 占 的 比例 非常 小 ， 从 而 影响 了 推 由 于 训练 集 Dorr 中 五 元 组 (ezzm,zg 力 的 数量 巨大 ， 直 接 优 
荐 准确 率 。 同 时 ， 由 于 签到 数据 的 隐 式 反馈 属性 ， 传 统 方法 将 ”化 目标 方程 式 OD 是 十 分 费时 的 。 与 文献 [2] 类 似 ， 本 文 从 
四 阶 张 量 中 的 缺失 项 拟 合 为 0， 从 而 难以 向 用 户 推荐 可 能 感 兴 ”训练 集 Derr 中 随机 独立 抽取 五 元 组 (wim,n,t) ， 使 用 随机 梯度 
趣 但 尚未 访问 过 的 兴趣 点 。 下 降 算 法 优化 目标 方程 式 (11)， 同 时 求解 参数 6 。 参 数 更 新 规 
连续 兴趣 点 推荐 的 任务 是 根据 转移 概率 对 兴趣 点 进行 排 则 如 下 : 
FF, 将 排名 在 前 N 位 的 兴趣 点 推荐 给 用 户 。 推 荐 任务 关注 的 是 ; 
u 0 = 9 aC In, - uint) — A0) (12) 
每 个 兴趣 点 对 应 的 转移 概率 的 排名 ， 而 非 真 实 的 转移 概率 值 ， 
因此 可 以 将 推荐 任务 建 模 成 对 兴趣 点 的 排序 任务 。 其 中 : 参数 学 习 率 w >0。 
m», e ius D Xin (5) 
B 3 su 
其 中 : Doo RH un 从 当前 兴趣 点 i 出 发 在 时 间 t 时 对 下 一 个 
兴趣 点 的 偏好 排序 。 式 (5) 表示 用 户 从 当前 兴趣 点 i 出 发 在 。 ”3.1 数据 集 描述 
T [8] PESE, 对 兴趣 点 m. 的 偏好 程度 大 于 对 兴趣 点 7 的 偏好 程度 。 本 文 实验 部 分 将 在 两 个 大 规模 数据 集 上 验证 算法 的 有 效 
本 文采 用 BPR 优化 标准 , 将 观察 到 的 转移 记录 和 未 观察 到 性 ， 这 两 个 数据 集 分 别 来 自 于 两 个 典型 LBSN (Foursquare 和 
的 转移 记录 组 成 样本 对 ,来 拟 合用 户 在 兴趣 点 对 上 的 偏 序 关系 。 ”Gowalla〉 的 真实 签到 数据 ， 其 中 Foursquare 的 数据 集 '" 来 自 
具体 而 言 , WRAHA u 从 当前 兴趣 点 i 出 发 在 时 间 i 访 问 了 兴趣 ”纽约 市 的 签到 数据 ，Gowalla 数据 集 '" 中 的 用 户 和 兴趣 点 分 布 
点 m ,而 没有 访问 兴趣 点 nn, 那么 本 文 假设 用 户 对 兴趣 点 m 的 于 世界 各 地 。 在 这 两 个 数据 集中 , 首先 过 滤 掉 少 于 25 条 签到 记 
偏好 程度 大 于 对 兴趣 点 的 偏好 程度 ， 即 mr > n 。 训 练 集 可 录 的 用 户 ， 然 后 每 个 数据 集 被 分 为 两 个 不 重 琶 的 集合 : 将 每 个 
以 形式 化 表示 为 用 户 的 签到 记录 按照 签到 时 间 的 先后 分 为 两 部 分 ， 早 期 80% 的 
Dy, (Gui mnt)|u eU, mneL,t eT) (60 ”签到 记录 作为 训练 集 ， 剩 下 20% 的 签到 记录 作为 测试 集 。 两 个 
其 中 : FIH Quom nt) RIR m», nn 数据 集 的 统计 信息 如 表 1 所 示 。 
根据 贝 叶 斯 法 则 ， 当 用 户 从 当前 兴趣 点 i 出 发 在 时 间 i 表 1 数据 集 统计 信息 
时 ， 访 问 下 一 个 兴趣 点 的 最 优 偏 序 关 系 Dua 可 以 建 模 为 数据 集 户 数量 兴趣 点 数量 签到 数量 
PO |», .) ec p, [90 p(0) (7) Foursquare 1638 81 846 127 141 
t 中 0 表示 模型 的 参数 集合 ， HI Gowalla 1254 75 656 176 699 
O= (V^, Vi ,VV Ve Vy" Sp). 3.2 算法 性 能 评价 指标 
段 设 每 个 用 户 之 间 是 相互 独立 的 ,并且 训练 集 Deos 中 的 每 推荐 系统 将 所 有 兴趣 点 按照 对 应 的 转移 概率 降序 排列 ， 并 
个 样本 对 之 间 也 是 相互 独立 的 ， 那 么 所 有 用 户 在 全 部 兴趣 点 上 ”将 排名 在 前 N 位 的 兴趣 点 组 成 候选 集合 SL 推荐 给 用 户 u 。 在 
偏 序 关系 的 似 然 函数 是 连续 兴趣 点 推荐 任务 中 ， 对 于 推荐 列表 中 的 兴趣 点 ， 用 户 仅 会 
OMe. [[ »w»,»»0 (8， 去 访问 一 个 兴 超 点 ， 这 使 得 推荐 准确 率 不 会 高 于 YN ， 其 中 六 
qe 人 表示 候选 兴趣 点 的 数量 。 因 此 ， 本 文采 用 召回 率 来 评价 推荐 系 
结合 式 CO, 用户 在 兴趣 点 对 上 的 偏 序 关 系 PON >, n|9) 统 的 性 能 ， 定 义 如 下 : 
可 以 表示 为 ge egt 
pim», | 0) = p, is, > Èran 10) Recall ON i TI a 
= p, uu > 0|0) (9) ”其 中 : Sw 表示 用 户 4 实际 访问 的 兴趣 点 ; |U| 表 示 用 户 的 数 
与 文献 [3] 类 似 ， 本 文 使 用 logistics 函数 和 表示 量 。 准 确 率 也 可 以 根据 召回 率 求 得 ， 即 
p(z>0):=o(z)=1/(Qd+e*)， 式 (9) 可 以 表示 为 Precision? N = Recall@N/N 。 
Pimi 7 Ruini > 010) = 0, imi 7S uu) (00 ”3.3 对 比 实验 
于 9 是 中 的 模型 参数 ， 所 以 6 可 以 被 省 略 T, un 本 文选 取 以 下 经 典 推荐 算法 作为 对 比方 法 : 
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录用 定稿 李 丹 霞 ， 等 : LBSN 中 融 
a) 矩阵 分 解 ”"。MEF 将 用 户 -项 目 矩 阵 分 解 为 用 户 和 矩阵 和 ”融合 时 空 信息 的 连续 兴趣 点 推荐 模型 ， 有 效 提高 了 推荐 质量 。 
项 目 矩 阵 ， 被 广泛 应 用 于 推荐 系统 中 。 具体 而 言 ， 本 文 模型 融合 LBSN 中 的 时 间 信 息 和 空间 信息 ， 绥 
b) 概率 矩阵 分 解 …。PMEF 假设 预测 评分 和 真实 评分 之 间 。” 解 了 数据 稀 琉 问题 ， 使 用 四 阶 张 量 模型 建 模 用 户 的 连续 签到 行 
存在 噪声 ， 使 用 带 高 斯 噪声 的 概率 图 表示 隐藏 特征 向 量 。 为 ， 满 足 用 户 的 个 性 化 需求 ， 针对 签到 行为 的 隐 式 反馈 属性 ， 


c) FPMC-LR "31。 该 算法 使 用 基于 用 户 一 当前 兴趣 点 一 下 


一 个 兴趣 点 的 三 阶 张 量 建 模 用 户 
里 距离 约束 ， 是 最 早 的 连续 兴趣 


的 连续 签到 行为 ， 并 融合 了 地 


为 防止 过 拟 合 和 模型 参数 快速 收敛 到 局 
模型 和 FPMC-LR 中 ， 设 置 参数 4 的 值 为 1。 
量 维度 的 增加 ， 模 型 拟 和 效果 和 所 需 计 算 资源 随 之 增加 。 为 了 


点 推荐 算法 。 
部 最 优 解 ， 在 本 文 
随 着 隐 式 特征 向 


平衡 模型 拟 和 效果 和 所 需 计 算 资源 ， 所 有 隐 式 特征 向 量 的 维度 


设置 为 32。 


在 实验 过 程 中 ,使 
优 值 ， 然 后 在 测试 集中 使 用 这 些 参数 进行 推荐 。 


fg: 


用 训练 集 优 化 求解 模型 参数 的 最 
图 2 和 3 


展示 


了 所 有 推荐 算法 在 连续 兴趣 点 推荐 任务 中 的 召回 率 。 实 验 结果 
分 析 如 下 : 
a)Zk 3C pA I FPMC-LR 都 优 于 MF 和 PMF， 表 明 传 统 推 


荐 算法 在 连续 兴趣 点 推 


荐 任务 中 效果 较 差 。 这 是 因为 MF 和 


PMF 仅 根 据 访问 记 


录 建 模 用 户 的 兴趣 偏好 ， 


忽视 了 用 户 连 续签 


到 行为 中 的 序列 信息 。 另外， 本 文 模 型 和 FPMC-LR 相 比 于 MF 


和 PMF 的 性 能 提升 
荐 任务 中 起 着 重要 作用 。 


厚度 很 大 , 说 明了 地 理 


言 息 在 连续 兴 


8 点 推 


b) 本 文 模型 的 推荐 性 能 始终 优 于 FPMC-LR, 表明 融合 时 空 


言 息 的 连续 兴趣 点 推荐 模型 可 


以 有 效 建 模 ) 


户 的 行为 模式 ， 提 


高 连续 兴趣 点 


Recall@N 


e 
o 
[zi 


o. 


E 荐 系统 的 准确 率 。 


3.4 时 间 信 息 的 影响 


本 文 将 时 间 分 为 四 个 时 间 段 ， 
在 时 间 信 息影 响 下 的 连续 签 
效 性 ， 在 建 模 过 程 中 分 别 使 ) 
对 比 。 实 验 结果 如 图 4 所 示 。 其 中 ， 


照 星期 分 为 工作 日 和 休息 


图 2 Foursquare 数据 集 上 的 召回 率 ” 图 3 ”Gowalla 数据 集 上 的 召回 率 


采用 四 阶 张 量 模 型 建 模 用 户 
到 行为 。 为 了 验证 时 间 段 切 分 的 有 
小 时 和 星期 ， 并 与 本 文 模型 进行 
W 表示 在 模型 中 将 时 间 按 
日 ，D 表示 在 模型 中 将 时 间 按 照 小 时 


分 为 白天 和 上 晚上。 实验 表 
将 时 间 分 为 四 个 时 间 段 能 
3.5 推荐 结果 的 定 


够 准确 理 
量 评估 


表明 本 文 模型 取得 了 最 好 的 推荐 效果 ， 
解 用 户 的 行为 模式 。 


LH 


对 于 不 同 地 理 距离 范 


所 内 的 测试 样本 ， 本 文 模型 的 召 


率 


是 不 同 的 .图 5 展示 了 本 文 模型 按照 地 理 距离 的 定量 评估 结果 。 


从 图 中 可 以 发 现 本 文 模型 不 仅 能 够 预测 | 
还 能 够 预测 用 户 偶尔 进行 的 长 距离 远 行 。 


距离 移动 ， 


4 ARE 


为 了 解决 连续 兴趣 点 


] 户 在 局 部 区 域内 的 短 


推荐 任务 中 面临 的 问题 


， 本 文 提 出 了 


采用 BPR 优化 标准 求解 模型 参数 。 在 Foursquare 和 Gowalla 两 
个 数据 集 上 的 实验 结果 表明 ,本 文 提 出 的 模型 T 已 有 的 算法 。 
015 ] "| i E 
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图 4 时间 信息 的 影响 图 5 推荐 结果 的 
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